
騰訊在延攬前 OpenAI 研究科學家 Yao Shunyu 後,發布了新版人工智慧模型 Hy3,並計畫倍增 AI 投資,展現其在全球 AI 市場的雄心。同時,中國 AI 公司 DeepSeek 也推出性能強勁的 V4 系列模型,進一步加劇了全球人工智慧領域的技術競逐。
騰訊近日發布了新版人工智慧模型 Hy3,這是該公司自從延攬前 OpenAI 研究科學家 Yao Shunyu 以來的首次重大模型更新。此舉顯示騰訊正積極加碼人工智慧領域,旨在全球激烈競爭中佔據一席之地。
根據《Computerworld》報導,騰訊計畫今年將其人工智慧投資倍增至超過 50 億美元。新推出的 Hy3 模型在複雜推理和程式設計方面展現改進,希望能在中國市場與字節跳動、阿里巴巴以及 DeepSeek 等主要競爭者抗衡。早在 2023 年,騰訊就曾宣稱其 Hunyuan 大型語言模型(LLM)能力優於當時的 ChatGPT 和 Llama 版本。
與此同時,中國 AI 新創公司 DeepSeek 也推出了其 V4 Flash 和 V4 Pro 系列大型語言模型。據《MIT Technology Review》報導,DeepSeek V4-Pro 的性能已能媲美頂尖的閉源模型,包括 Anthropic 的 Claude-Opus-4.6、OpenAI 的 GPT-5.4 和 Google 的 Gemini-3.1。該模型在程式設計、數學和 STEM 問題上的表現尤為突出,超越了阿里巴巴的 Qwen-3.5 和北京智譜華章科技有限公司(Z.ai)的 GLM-5.1 等其他開源模型。
DeepSeek V4 模型在處理長文本方面也實現顯著進步,其預設的上下文視窗高達 100 萬個 token,與 Gemini 和 Claude 等領先模型看齊。這項技術的突破得益於全新的「混合注意力架構」(Hybrid Attention Architecture),能夠更好地理解提示中的各部分關聯,有效解決了長上下文模型在記憶和理解上的挑戰。
